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Chapitre 1 

Eléments du calcul des probabilités 


1. Introduction 

La théorie (ou le calcul) des probabilités est une branche des mathématiques qui 
permet de modéliser les phénomènes où le hasard intervient, initialement 
développée à propos des jeux de hasard, puis progressivement étendue à 
l'ensemble des sciences expérimentales, dont la physique, la biologie, l’économie, 
la géographie, les sciences humaines, la médecine, etc. 

Cette théorie permet de construire des modèles de ces phénomènes et permet le 
calcul : c'est à partir d'un modèle probabiliste d'un jeu de hasard comme le jeu de 
dés que l'on peut prédire les fréquences d'apparition d'événements comme le 
nombre de fois que l'on obtient une valeur paire en jetant un dé un grand nombre 
de fois. 

Le scientifique est capable, en utilisant les mathématiques, de prédire le 
comportement d'un modèle donné, c'est par exemple une « loi » de la physique : 
c'est la démarche déductive. A l'inverse, observant des faits expérimentaux il va 
tenter de dégager des propriétés générales du phénomène observé qu'il va en 
général représenter sous forme d'un modèle. Toutes les lois de la physique et de la 
chimie sont des modèles mathématiques les plus généraux possibles des faits 
expérimentaux : c'est la construction inductive de la théorie. Cette démarche 
générale va plus loin car le modèle permet de prédire des expériences non 
réalisées. Si les prédictions ainsi réalisées sont contradictoires avec les résultats 
expérimentaux alors on pourra avec certitude réfuter le modèle; dans le cas 
contraire on garde le modèle mais on n'est pas certain qu'il soit « vrai ». 
Autrement dit, à l'issue d'un tel test on ne peut avoir de certitude que si on a 
trouvé des éléments permettant de réfuter le modèle. Nous verrons dans la suite 
que cette approche se transpose exactement dans la démarche statistique, en 
particulier dans le domaine des tests. 
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2 . 


Notions de base 


a) Evénement 

On peut dire que tout ce qui peut se réaliser ou ne peut pas se réaliser, à la 
suite d’une expérience spontanée ou provoquée parfaitement est un événement. 
Exemple 1.1 

En jetant un dé 

« Obtenir un 6 » est un événement, 

« Obtenir un nombre compris entre 1 et 6 » est un événement, 

« Obtenir un 7 » est un événement. 

b) Expérience aléatoire 

Une expérience aléatoire ou épreuve est un ensemble de conditions précisent 
caractérisant un processus à la suite duquel l’événement est réalisé ou non. 

c) Evénement élémentaire 

Il s’agit d’un événement qui ne sera réalisé que par un seul résultat de 
l’expérience aléatoire. 

Exemple 1.2 

En jetant un dé 

« Obtenir un 6 » est un événement élémentaire, 

« Obtenir un nombre pair » n’est pas un événement élémentaire, car il peut être 
réalisé par plusieurs résultats de l’expérience aléatoire qui sont : {2}, {4}, {6}. 

d) Ensemble fondamental 

L’ensemble fondamental associé à une certaine expérience aléatoire E, est 
l'ensemble de tous les résultats "élémentaires" possibles de E. Cet ensemble 
fondamental sera toujours noté O. 

Exemple 1.3 

Si on jette un dé, tous les résultats possibles sont : 1, 2, 3, 4, 5, 6. 

=> O = {1, 2, 3, 4, 5, 6} ensemble fondamental. 
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Si on lance une pièce de monnaie, tous les résultats possibles sont : pile, face 
=> Q = {pile, face} = {p, f] ensemble fondamental. Pour simplifier, nous notons p 
au lieu de pile et f au lieu de face. 

Remarque 

1) Tout événement, élémentaire ou non, peut être considéré comme une partie 
de Q. 

2) Lorsque Q est fini ou dénombrable, l’ensemble des événements et 
l’ensemble des parties de Q, c’est-à-dire P (Q). 


3. Logique des événements 


Soit Q. l’ensemble fondamental associé à une certaine expérience aléatoire E. 


Notions 

Vocabulaire ensembliste 

Vocabulaire probabiliste 

q e Q 
Aclî 
co e A 
AcB 
AUB 

a n b 

A ou A c 
0 
Q 

A fl B = 0 

Point de Q 

Sous-ensemble de Q ou partie de Q 
co appartient à A 
A est contenu dans B 
Réunion de A et de B 
Intersection de A et B 
Complémentaire de A 
Ensemble vide 
Ensemble plein 
A et B disjoints 

Résultat possible, épreuve ou événement 
Evénement 

A est réalisé si co est le résultat de l’expérience 
A implique B 

A ou B (le ou n’est pas exclusif) 

A et B 

Contraire de A par rapport à Q 
Evénement impossible 
Evénement certain 

A et B incompatibles ou mutuellement exclusifs 


A E 


A 



AUB 



E 
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ù 




A c B 


Exemple 1.4 

L’expérience aléatoire consiste à tirer une carte dans un jeu de 32 cartes. 

A = « tirer un as », 

B = « tirer un roi », 

C = « tirer un cœur », 

A U C = « tirer un as ou un coeur », 

A fl C = « tirer un as de coeur », 

A fl B = « tirer un as et un roi », c’est impossible car on ne peut pas tirer un as et 

un roi avec une seule carte. 

A = « tirer une carte autre que as ». 
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Soit Q l’ensemble des événements élémentaires (ensemble fondamental ou 
univers). 

On arrive au point essentiel de définir la probabilité d’un événement AcD, qui 
doit mesurer la chance que l’événement A a de se réaliser lorsqu’on effectue une 
épreuve. 

La complexité de la définition dépend de celle de Q : fini, infini dénombrable, 
infini non dénombrable. 

4. Définition de la probabilité dans le cas Q fini 

Définition 1.1 

Soit Q fini, dont les événements élémentaires sont équiprobables (chaque 
événement a autant de chance d’apparaître que n’importe quel autre événement). 

P (A) = card A = Nombre de cas favorables 
card Q Nombre de cas possibles 

Attention à l’hypothèse d’équiprobabilité. 

Exemple 1.5 

Une urne contient une boule blanche (IB) et une boule noire (IN). 

On fait 2 tirages avec remise. Quelle est la probabilité d’avoir 2 Noires ? 

On a Q = {(N, N); (B, B); (B, N); (N, B)}, card Q = 4. 

A : ”avoir 2 Noires” c’est A = {(N, N)}. 

On a P (A) = card A = 1/4 
card Q 


Remarque 

Si on ne tient pas compte de l’ordre et que l’on écrit Q = {{N, N}, {B, B}, 
{B, N}}, les événements élémentaires n’étant pas équiprobables, on n’a pas 
P(A) = cardA 
card Q 

Erreur : on aurait P (A) = 1/3 ! ! 

Exemple 1.6 

Soit une urne contenant 4 boules 1 rouge (IR); 1 verte (IV); 1 jaune (IJ) et 1 
blanche (IB). 

On effectue 3 tirages avec remises. Quelle est la probabilité d’obtenir 2 fois la 
boule blanche ? 

On a card 0 = 4x4x4 = 64. 

Soit A : ”2 fois la blanche exactement”. 

A = {(BBN), (BBV), (BBJ), (BRB), (BVB), (B JB), (RBB), (VBB), (JBB)}. 

Ainsi card A = 9. 

Donc P (A) = 9 
64 
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Exemple 1.7 

Soit une ume contenant 5 boules 2 vertes (2V) et 3 blanches (3B). 

1) On effectue 2 tirages sans remise. 

a) Quelle est la probabilité d’avoir 2 vertes exactement ? 

b) Quelle est la probabilité d’avoir 2 blanches exactement ? 

c) Quelle est la probabilité d’avoir 1 Y et IB ? 

2) Même question avec tirage avec remise. 

1) On ne peut pas appliquer la définition car les événements ne sont pas 
équiprobables. 

2) On écrit Q = {(B ,B 2 ), (B jB 2 ) (B ,B 2 ) (B iB 2 ) (B jB 2 ). . .} 

a) P (avoir 2 vertes exactement) = 2_ \ = J_ 

5 4 10 

b) P (avoir 2 blanches exactement) = 3_ 2 =_3 

5 4 10 

c) P (avoir 1 verte et 1 blanche) = 2 3 +2 3= J_2 = 3 

5 4 5 4 20 5 

2) On a card Q = 5 2 = 25, ainsi 

a) P (avoir 2 vertes exactement) = 2x2 =_4 

25 25 

b) P (avoir 2 blanches exactement) = 3x3 =_9 

25 25 

c) P (avoir 1 verte et 1 blanche) = 2x3x2 = 12 

25 25 

Propriétés 

P (A) + P(Â)=l,VAeP (Q). 

P (A u B) = P (A) + P (B) - P(A n B), VA,BeP (Q). 

A <= B => P (A) < P (B) 

A démontrer en utilisant les propriétés du cardinal. 

5. Probabilités : Définition axiomatique 

5.1. Introduction 

Si Q est infini, la définition précédente devient caduque. Les fondements de la 
probabilité mathématique sont dus à Kolmogorov (1933). 

Considérons l’expérience aléatoire : on tire au hasard sur une cible plane C. on 
suppose que chaque coup atteint la cible. Le résultat de chaque tir peut être 
représenté par le point d’impact M, Q est ici l’ensemble des points de C, il est 
donc infini. Soit A une partie de Q. 
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Notons A = l’événement ” l’impact est dans A”. 

Intuitivement : si le tir se fait au hasard, on a : P (A) = aire (A) , 

aire(C) 

mais cette formule n’a de sens que si l’on peut définir l’aire de A. Or on peut 
démontrer qu’il existe des parties de C dont on ne peut pas définir l’aire (par 
exemple si A = un point, aire(A) = 0, mais P (touché un point) ^ 0). On n’est donc 
amené à généraliser la notion d’espace probabilisable. 

5.2. Tribu (ou a-algèbre) 

Définition 1.2 

Soit Q un ensemble fondamental. On appelle tribu ou a-algèbre, tout 
ensemble A tel que : 

1) Q e A., 

2) V A e A, A e A. 

3) pour toute famille (A ,) j e i (finie ou infinie dénombrable) de A, u A , e A. 
Le couple (Q, A) est appelé espace probabilisable. Les éléments de A sont appelés 
événements. 

Exemple 1.8 

{0, A} est une tribu, appelée tribu triviale. 

Soit A 14 Q, alors {0, A, A , Q } est une tribu, appelée tribu engendrée par A, 
c’est-à-dire la plus petite tribu contenant A. 

Remarque 

Lorsque Q est fini ou infini dénombrable, on considère toujours A =P (Q). 

Théorème 1.3 

Soit A une tribu de Q. 

• 0 e A. 

• V A, B e A , alors AuB, AnB, A - B sont des éléments de A 

• V (A;); e i <z A, finie ou dénombrable, on a nAi e A. 

5.3. Système complet d’événements 
Définition 1.4 

Soit A une tribu de Q. On appelle système complet d’événements de Q, toute 
famille finie ou dénombrable (Ai)i e i telle que : 

1) V i e I, Ai e A 

2) uA; = Q 

3) AjnAj= 0 , V (i,j) e I 2 tel que i ^ j. 

Exemple 1.9 

Si A e A, {A, A } est un système complet 
Exemple 1.10 

On jette un dé cubique : les résultats sont 1,2, ..., 6 
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A = {1,3, 5}, B = {2}, C ={4,6} 

{A, B, C} est un système complet. 

5.4. Espace probabilisé 

Définition 1.5 

Soit (Q, A) un espace probabilisé. On appelle probabilité sur (Q, A) toute 
application 

P: Ai à [0,1] 

A i * P (A) 

Vérifiant les axiomes : 

1) P (Q) = 1 

2) si (Ai )i e n est une famille dénombrable d’événements deux à deux 
disjoints, c’est-à-dire deux à deux incompatibles, alors P(uAi) = Z P(A;) 

Le triplet (Q, A, P) est appelé espace probabilisé et P (A) la probabilité de A. 
Remarque 

Si P (A) = 0, alors on dit que A est négligeable. 

Si P (A) = 1, alors on dit que A est presque sûrement vraie (ou presque sûrement 
certain). 

Théorème 1.6 

Soit (Q, A, P) un espace probabilisé et soient A et B deux événements de A , 
on a : 

• P (0) = 0 

• Si A et B sont incompatibles alors P(AuB) = P(A) + P(B) 

• Si Ai, A 2 , ... A n sont deux à deux incompatibles alors P (uAj) = Z P(Ai) 

• P(À)= 1 - P (A) 

• P (A - B) = P (A) - P (AnB) 

• Si A cz B, alors P (A) < P (B) 

• P (AuB) = P (A) + P (B) - P (AnB) 

6. Probabilités conditionnelles - Notion d’indépendance 

Les concepts d’indépendance et de probabilité conditionnelle sont définis 
explicitement par Abraham De Moivre (1667 - 1754). On lui doit également un 
énoncé clair et précis de la formule des probabilités composées. 

Soit Q un ensemble fondamental lié à une expérience aléatoire E, P une 
probabilité sur (Q, A). 

Soient A, B deux événements, A cz Q, P(A) > 0 et B cz Q. 

Définition 1.7 

La probabilité conditionnelle de B sous l’hypothèse A est définie par 
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P (B | A) = P (A o B) 
P (A) 


Signification : P (B | A) exprime la probabilité de B quand on sait que A est déjà 
réalisé. 

On dit couramment probabilité de B sachant A. 


Exemple 1.11 

On extrait sans remise 2 cartes d’un jeu de 32. La première carte tirée est un 
roi. Quelle est la probabilité que la 2ème carte soit aussi un roi ? 

P (B | A) = 3 
31 

Si on veut appliquer la définition, c’est plus compliqué : P (A) = 4 

32 


P (A n B) = 43 
32 31 

donc P(B | A) = 43 x 32_= 3 
32 31 4 31 


Ainsi en général on utilise la relation dans le sens P (A n B) = P (B | A) x p (A) 

Propriété 

Formule des probabilités composées 

P (A n B) = P (B | A) x p (A) si P (A) > 0 
P (A n B) = P (A | B) x p (B) si P (B) > 0 


Exemple 1.12 

Soit un jeu de 52. On fait 2 tirages avec remise. Probabilité que la première 
carte soit un roi rouge et la 2ème un roi noir ? 

A: ”la première carte est un roi rouge” et 
B : la deuxième carte un roi noir”. On a 
P (A n B) = P (B | A) x p (A), Ainsi P (A) = 2 

52 

et P (B | A) = 2_ = P(B) , donc P(An B) = 2_ _2_ = P(A)P(B) 

52 52 52 

Définition 1.8 

Soient A, B c= Q, avec P(A) > 0 et P(B) > 0 
A et B sont indépendants si et seulement si 

P (B | A) = P (B) ou P (A | B) = P (A) 

Ce qui est le cas dans un tirage avec remise. Le tirage de la première carte n’influe 
pas sur le tirage de la 2ème. Ce n’est plus le cas pour les tirages sans remise. 

Caractérisation 

A et B (P (A) > OP (B) > 0) sont indépendants si et seulement si 
P (A \ B) = P (A) x p (B) 
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Exemple 1.13 

Soit une ume contenant 10 boules blanches, 20 boules rouges et 30 boules 
noires. On tire 2 boules sans remises. Probabilité que la première soit rouge 
(événement A) et la deuxième soit blanche (événement B) ? 

On a P (An B) = P(B | A) x P(A). (Pas d’indépendance) 

On a P (A) = 20_=J_ 

60 3 

et P(B | A) = 10 
59 

Donc P (A nB) = 10 x 1 
59 3 

Même question avec des tirages avec remises 

P (A nB) = P (A) P (B) = Ix 10 =J_ 

3 60 18 

7. Théorème des probabilités totales et théorème de Bayes 

7.1. Système exhaustif 

Soient Bi, B 2 , . . ., Bk, k événements associés à une expérience aléatoire E avec 
O l’ensemble fondamental. Bi, B 2 , ..., Bk constituent un système exhaustif si : 

1) BiflBj = 0; V i pour i, j = 1, ..., k 

2) P (B;) > 0 V i = 1, ..., k 

k 

3) U^ = Q 


Exemple 1.14 

Considérons l’expérience qui consiste à jeter un dé, donc l’ensemble 
fondamental O = {1, 2, 3, 4, 5, 6}. 

Le système Bi = {3} B 2 = {1,2} et Bk = {4, 5, 6} est un système exhaustif. 
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P (B;) > 0 Vi = 1,2,3 

B; fl Bj = 0; V i f j pour i, j = 1, 2, 3 

Bi U B 2 U B 3 = Q. 


7.2. Théorème des probabilités totales 
Théorème 1.9 

Soient A un événement et Bi, B 2 , . . Bkun système exhaustif, on a : 

k 

P (A) = S P (A/ Bi) P (Bi) 

i = 1 

Démonstration 

k 

A =U(AnB 1 ), les événements (Af|Bj )sont mutuellement exclusifs pour tout 
i=l 

i = 1,2, k. 

k k 

P(A) = P(Q(AflB i ))=X P(AnBi). 

i=l i=1 

De plus P (AflB- )= P (A / B;) P (Bi) ; car P (Bi) > 0, ce qui entraîne 

k 

P (A) = X P (A / B;) P (B;). 

1=1 


7.3. Théorème de Bayes 

Ce théorème permet de déterminer la probabilité pour qu’un événement qui 
est supposé déjà réalisé, soit dû à une cause plutôt qu’à une autre, d’où le nom de 
théorème des probabilités des causes ce qui lui a donné Bayes. 

Théorème 1.10 

Soient A un événement de probabilité P (A) > 0 et Bi, B 2 , ..., Bk un système 
exhaustif. On suppose connaître les probabilités P (A / B;) et P (B;), pour 
i = 1, ..., k, alors 
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P(Bi/A) = 


V 1 = 1, k. 


P(A/Bi)P(Bi) 

~ 

J>(A/Bi)P(Bi) 


Démonstration 


Pour chaque 1 fixé, 1 variant de 1 à k, on a : 


P(Bi |A) 


P(A n B! ) 
P(A) 


P(A/Bi)P(Bi) 

P(Â) 


P(A/Bi)P(Bi) 

k 

^P(A/Bi)P(Bi) 

i=l 


, d’après le théorème 1.8 (probabilités totales) 


et ceci pour tout 1 = 1, . . k. D’où le résultat du théorème. 


Exemple 1.15 

Soit un sac contenant 6 jetons : 5 numérotés 1 et 1 numéroté 2. 

Soient 2 urnes : Ui contenant six boules blanches et quatre noires et U 2 contenant 
8 blanches et 2 noires. L’expérience aléatoire comporte 2 étapes. On pioche au 
hasard dans le sac, on regarde le numéro et on pioche dans fume correspondante. 
Quelle est la probabilité que la boule soit blanche ? 

On a Ui u U 2 = Q et Ui n U 2 = 0°, on a donc 
P (B) = P (B n Ui ) + P (B nU 2 ) 

= P (B | Ui) x p (Ui) + P (B | U 2 )P (U 2 ) 

= (6/10x5/6) + (8/10x1/6) = 1/3 +2/15 = 7/15. 


Autre question : sachant que la boule est blanche quelle est la probabilité qu’elle 
provienne de Ui : 

On a P (Ui | B) = PtB n U ,) = PtB I U i ) x pqj ,) = PtB I U , ) x pqj ,) 

P(B) P(B) P(B | Ui) x P(Ui) + P(B | U 2 ) x 

P(U2) 


= (6/ 1 0x5/6)/ (7/15)= (l/3)/(7/15) = 5/7. 


Exemple 1.16 

Une population est constituée de 10 Français, 10 Allemands. 7 Français sont 
bruns, 3 blonds, 1 Allemand est brun, 9 blonds. 

On rencontre un blond, quelle est la probabilité qu’il soit Allemand ? 

Soient les événements A = ”il est blond”, B 1 = "Allemand” et B 2 = "Français”. 

On connaît P (B 1 ) = 1/2, P(B 2 ) = 1/2, P(A | B 1 ) = 9/10 et P(A | B 2 ) = 3/10. 

On cherche P (Bi | A). 

On a B 1 u B 2 = Q et Bi n B 2 = 0, on peut donc appliquer le théorème de Bayes : 

P (Bi | A) = P(AIBi) xP(Bi) 

P (A | Bi) x p (Bi) + P (A | B 2 ) x p (B 2 ) 

= (9/10x1/2)/ (9/10x1/2 + 3/10x1/2) = 3/4 


12 



Exemple 1.17 

Une entreprise utilise 3 machines différentes A, B, C pour fabriquer des 
pièces. 40 % sont fabriquées par A, 30 % par B et 30 % par C. La machine A 
produit 2 % de pièces défectueuses, B 4 % et C 5 %. 

1) On prélève une pièce au hasard. Quelle est la probabilité qu’elle soit 
défectueuse ? 

2) On prélève une pièce, elle est défectueuse. Quelle est la probabilité qu’elle 
vienne de A ? 

3) On prélève une pièce, elle est parfaite. Quelle est la probabilité qu’elle vienne 
de C ? 

Soient A : ” être fabriqué par A”, 

B : ” être fabriqué par B”, 

C : ” être fabriqué par C”, 

D : ” être défectueuse” et 
D : ” parfaite” 

On a P (A) = 0.4, P (B) = 0.3, et P (C) = 0.3. 

A, B, C sont tels que A n B = 0°, AnC = 0°, C n B = 0 et A uB u C = Q. 

1) En appliquant la formule des probabilités totales, on a 

P (D) = P (D | A) x p (A) +P (D | B) x p (B) +P (D | C) x P (C) 

= 0.02 x 0.4 + 0.04 x 0.3 + 0.05 x 0.3. 

2) D’après le théorème de Bayes, P (A | D) = P (D | A) x p (A) = 0, 02 x Q, 4 

P (D) P (D) 


3) P(C | D ) = P_(D | Cl x p(Q = Q, 95 x Q, 3 
P (D ) 1 - P (D) 

Exemple 1.18 

Une urne contient 10 B, 20 R et 30 N. 

On tire 3 boules sans remise. Quelle est probabilité que les 2 premières soient 
rouges et la troisième noire ? 

Soient les événements : A la première boule tirée est rouge”, B :”la 2 eme est 
rouge”, on a 

P (A n B) = P (B | A) x p (A), or P (A) = 20/60 = 1/3 et P (B | A) = 19/59. Donc 
P (An B) = 19/59x1/3. 

Posons C = A n B. 

Soit D :”la troisième est noire”. On a P(D n C) = P(D | C) x p(C) = 
(30/58)x(19/59x3) 

Exemple 1.19 

Soient 2 dés ; l’un d’eux est pipé, il permet d’obtenir 6 dans 50 % des cas ; 
l’autre est parfait. On lance l’un des deux dés choisi au hasard. On obtient 6. 
Quelle est la probabilité qu’on ait utilisé le dé équilibré ? 
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Soient E : ”le dé est équilibré,” 

P : ”le dé est pipé,” 

A : "obtenir 6”. 

Les données sont P (E) = 1/2, P (P) = 1/2, P (A | E) = 1/6 et P (A | P) = 1/2. 
OnaEuP = QetEnP =0 °. On peut donc appliquer le théorème de Bayes 
P(E | A) = P(A I E) x p(E) = (l/6xl/2)/(l/6xl/2+l/4)= 0.25 

P (A | E) x p (E) + P (A | P) x p (P) 
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Chapitre 2 


Variables aléatoires et lois de probabilité 


Considérons un ensemble fondamental Q. correspondant à une certaine 
expérience. Les éléments de Q, résultats possibles de l'expérience, ne sont 
généralement pas des nombres. Il est cependant utile de faire correspondre un 
nombre à chaque élément de Q, en vue de faire ensuite des calculs. Pour un jet de 
dé, il semble naturel de faire correspondre à la face obtenue par le jet, le nombre 
de points qu'elle porte, mais ce n'est pas une obligation. Si on jette 2 dés, on 
s'intéressera par exemple à la somme des points obtenus. Pour une carte à jouer, il 
faut convenir d'une valeur pour chaque carte. 

1. Variables aléatoires 

Définition 2.1 

On appelle variable aléatoire réelle (v.a.r) toute application mesurable 

X : (Q, A) i Br) 

co i ^ X (co) 

• B r est la tribu boreliène sur [R, c’est - à - dire la tribu engendrée par les 
intervalles ouverts de R. 

• Mesurable : V A e B R : X' 1 (A) e A « X' 1 (A) = { co e Q / X(co) e A} 
Remarque 

Si X (Q) = Y est discret (fini ou infini dénombrable), alors X est dite 
variable aléatoire réelle discrète. 

Si X (Q) est un ensemble continu de IR, alors X est dite variable aléatoire 
réelle continue. 
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Notations 


Si X est une variable aléatoire réelle définie sur U, et si a e IR alors : 

1) (X = a) = { (û e Q / X (a ) = a} c’est l’ensemble des résultats de 
l’expérience aux quels x associe la valeur a. 

2) (X<a)= { co e Q/X(co)<a} 

3) (a < X < b) = { <x> e Q / a < X (<» ) < b} , i ci on suppose a < b 

4) Si E est une partie de [R, alors (X e E) = { co e Q / X (co ) e E} 

Exemple 2.1 

On lance 2 pièces de monnaies => Q = {p, f} 2 = {(p, p), (p, f), (f, p), (f, f)}, 

Le joueur marque 1 point chaque fois qu’il obtient ‘’p” 

V = X ( Q . ) = {0, 1, 2}, X est une variable aléatoire discrète (v.a.discrète) 

(X= 0) = { oo e Q / X (oo ) = 0} = {(f, f)} 

X' 1 ({1}) ={»EÜ/X(») = 1) = «p, f), (f, p)}. 

2. Loi de probabilité - Fonction de répartition - Densité de 
probabilité 

2.1. Loi de probabilité 

Définition 2.2 

On appelle loi de probabilité d’une variable aléatoire réelle X définie sur (Q, 
A), la donnée des probabilités P(X e E), pour tout intervalle E de [R. 

Plusieurs cas se présentent 

a) Variable aléatoire discrète finie 

V = X (O) = {xi,x 2 , . . x n } 

La loi de probabilité de X est parfaitement déterminée par la donnée des quantités 
Pi = P (X = x;), pour tout i = 1,2, . . ., n, vérifiant : 
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# >0, V i=l,...,n 

n 

2>,= 1 

i = 1 

b) Variable aléatoire discrète dénombrable 

V = X (Q) = {xi,x 2 , ...,x n , 

La loi de probabilité de X est parfaitement déterminée par la donnée des quantités 
Pi = P (X = x;), pour tout i g N*, vérifiant : 

Pi>0, V i=l,...,n 

oo 

2>=i 

. i = 1 

c) Variable aléatoire continue 

V = X(f!)çR, 

La loi de probabilité de X est parfaitement déterminée par la donnée des 
probabilités P (X < x), V x e IR. 

2.2. Fonction de répartition et densité de probabilité 

Définition 2.3 

On appelle fonction de répartition, ou fonction de distribution, d’une variable 
aléatoire réelle X, l’application 

F : U i ^ [0,1] 

x l > F(x) = P ( X < x). 


Propriétés 

La fonction de répartition F(x) d’une variable aléatoire réelle X satisfait les 
conditions suivantes : 

• 0 < F(x) < 1, V x g IR 

• lim F(x) = 0 et lim F(x) = 1 

n ->- oo n—> + oo 

. F (a) < F (b), V a < b, c’est - à - dire F(x) est une fonction croissante 

• F(x) est une fonction continue à droite, en tout point x, c’est-à-dire 
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lim F(x + h) = F(x), V x e IR. 

h— >0 


*Représentation graphique de la fonction de répartition (f.r) 

a) cas discret fini 
V = X (Q) = {xi, x 2 , — 5 x n } 


* F (x;) = P(X < x;) = P(X = xi) + P(X = x 2 ) + ... + P(X = xO 

= Pl + p2 + •••• + Pi 

* F(x) = F (xi), pour tout x, < x < x,+i 


F(x) 


1 


Pi. 

r r 

i- L 

E 

= c 

ï — • — 

— C 

* 1 1 * 


X2 X3 ^ XiM 

Fonction de répartition d’une v.a.r discrète finie 


Le graphique de F(x) se présente sous la forme d’une courbe en escalier, 
présentant des sauts de valeurs p;, en chacune des valeurs discrètes x, prises par la 
v.a.r X. 


Exemple 2.2 

Reprenons l’exemple 2.1, pour lequel on lance 2 pièces de monnaies 
équilibrées. 

P(X = 0) = P((f,f))=i 
P(X = 1) = P ((f, p), (p, f))=^ 
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P(X 

v = 

Si x 
SiO 

Si 1 

Si 2 


= 2) = P((p,p))=- 
X(Q) ={0,1,2} 

< 0, alors on a : F(x) = P (X < 0) = 0 


< x < 1, alors on a : F(x) = P (X < x) = P (X = 0) = — 

1 1 3 

< x < 2, alors on a : F(x) = P(X<x) = P(X<l)= — + — = — 

1 1 1 

< x, alors on a : F(x) = P (X < x) = P (X < 2) = — + — + — =1 


F(x) 


3 

4 

1 

4 * 


E- 

E n 


.2 -1 0 1 2 3 4 

Fonction de répartition de l’exemple 2.2 


b) cas discret infini dénombrable 

Même chose que le cas discret fini, seulement on a un nombre infini de valeurs. 


Définition 2.4 

Si la fonction de répartition F(x) d’une v.a.r. continue X est dérivable pour 
tout x élément de R, de dérivée f(x), sauf peut être en un nombre fini de points, et 
si : 

x 

V X e R, P(X < x) = F(x) = jf( t )dt ■ 

— 00 

On dit que X est une v.a.r absolument continue (ou à densité), et la fonction 
f(x) est appelée la densité de probabilité de X. 

* Représentation graphique de la fonction de répartition (f. r) : cas continue 
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Exemple 2.3 

On considère la fonction F(x) 


0 si x < 0 
l-e” x si x>0 


F(x) 



Fonction de répartition de l’exemple 2.3 


F’(x) 


d F(x) 
dx 



si x < 0 
si x > 0 


On peut poser f(x) 


0 


si x < 0 
si x > 0 
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f(x) 



Fonction de densité de l’exemple 2.3 

Propriétés 

Si X est une v.a r. absolument continue de densité f(x), alors on a : 

b 

VaeR,VbeR,a<b,P(a<X<b)=f = F(b) - F(a) 



00 

-Vt e U, f (t) > O.et / f(t)dt 

— 00 


1 


Remarque 

P(X = a) = 0, V a e IR, car X est une v. a. absolument continue. 
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3. Espérance mathématique et moments 


Historiquement, la notion d’espérance mathématique est née dans le but de 
partager équitablement les enjeux dans des jeux de hasard opposant plusieurs 
joueurs lorsqu’une partie du jeu venait à être interrompue avant son terme. 

On peut dire aussi que l'espérance mathématique cherche à traduire la 
tendance centrale de la loi. Il s'agit d'une moyenne où chacune des valeurs x; 
intervient d'autant plus que sa probabilité est importante, c'est-à-dire d'un 
barycentre ou d'un centre de gravité. 

3.1. Variable aléatoire discrète finie 


Définition 2.5 

Soit X une v. a. discrète finie sur (O, A, P), on appelle espérance 

mathématique de X, notée E(X), la quantité : E(X) = Z x; P(X = x;), où {xi, X 2 , . . ., 
x n } est l’ensemble des valeurs de X. 


Exemple 2.4 

Le jeu de « chuck - a - luck » (lancer une chance), se jeu comme suit : 

On lance 3 dés parfaits, le joueur mise 1 dh, par exemple, sur l’un des nombres 1, 
2, 3, 4, 5, 6. 

Supposons qu’il mise sur le 5, 

Si le 5 sort 1 fois, le joueur gagne 1 dh 
Si le 5 sort 2 fois, le joueur gagne 2 dh, 

Si le 5 sort 3 fois, le joueur gagne 3 dh. 

Si le 5 ne sort pas, le joueur perd 1 dh. 


Soit X la variable aléatoire qui correspond au gain net du joueur, c’est une 
variable aléatoire discrète avec V = X (O) = {-1, 1,2, 3} 


• P(X = -1) 


125 1 

2Î6 > 2 
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P (X = 1) = 


P (X = 2) 


P (X = 3) = 


125 75 

E(X ) = (- 1 )m +(1) m 


777 + (!) 777 + ( 2 ) ^ + ( 3 )^ = ' °’ 08 - 0n P eut dire q u ’ en 


moyenne, le joueur perd 8% de sa mise. 


3.2 Variable aléatoire discrète dénombrable 


Définition 2.6 


Soit X une v. a. discrète dénombrable sur (Q, A, P), on appelle espérance 


mathématique de X, notée E(X), la quantité : E(X) = 2—t x i P(X = Xj), où {xi, X2, 

i = 1 

x n , •••} est l’ensemble des valeurs de X, existe lorsque la série est 
convergente. 


Exemple 2.5 

Soit X une v.a discrète infinie dénombrable, où V = {0, 1,2, . . . , n, . . . . } et 

p k = P(X = k) =7— , X > 0, donc E(X) = X k P(X = k) = X k A— = X. 

k\ k = î k=\ k\ 


Exemple 2.6 (v.a. discrète n’admettant pas d’espérance) 

2 

Soit X une v.a.r. qui prend les valeurs x 3k , k e N* avec P(X = x 3k )= , cela 

définit bien une loi de probabilité, en effet : 


V k e N*, —rrr > 0 et 


Z 2 2 V 1 t 2 1 

777 — T (x) — T T — 1 • 

k=l J 3 k= l * J j f 

3 


1,21 
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La série 


2 


3k 


k = 1 3 

n’admet pas d’espérance mathématique. 


k+l est la série de terme général — qui diverge, donc X 


3.3. Variable aléatoire continue 
Définition 2.7 

Soit X une v.a. absolument continue sur (O, A, P), de densité de probabilité 
f(x), on appelle espérance mathématique de X le nombre : 

oo 

E(X) = |xf ( x)dx ( .J XdP 

), cette espérance mathématique existe 

— oo 

lorsque l’intégrale est convergente. 

Exemple 2.7 

Soit X une v.a.r. qui admet comme densité de probabilité la fonction 


F(x) = 1 


si x g [ 0 , 3 ] 


0 


smon 


ï 


F(x) est bien une densité de probabilité, en effet : 


00 3 1 

E(X) = J xf(x)dx = J X -dx = i [ 12 ,3 9 ! 

—oo 0 ^ 

Exemple 2.8 (v. a. continue n’admettant pas d’espérance : loi de Cauchy) 
Soit X une v.a.r absolument continue de densité de probabilité 

f(x) = — . — VxëR, 

71 l + x Z 

f(x) est bien une densité de probabilité, en effet : 


F(x) > 0 et 


J f(t)dt 
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1 


f(x) > 0 et J f(t)dt = | dx = 1 f dx = — [arctg(x)] 0 ' 

71 ^ 


2 71 _ 
71 2 


E(X) = J xf(x)dx = I J - 


+ X 


2 dx n ’existe pas, car — - est équivalente 

1 + x 2 


à — au voisinage de l’infini 

x 


II 

A - 1 - 


+ X 


2 dx n ’ es t pas définie => E(X) n’existe 


pas. 


Théorème 2.8 

Soient X et Y deux variables aléatoires définies sur le même espace 
probabilisé (Q, A , P), alors on a : 

1) Va, b e R, E(a. X + b) = a. E(X) + b 

2) V a, be R, E (a. X + b. Y) = a. E(X) + b. E(Y) 

Démonstration 


Supposons que les v.a.r X et Y sont absolument continues de densités 
respectivement f(x) et g(y) (la démonstration reste valable pour le cas discret). 


1) E (a. x + b) = { ( a x + b)f(x)dx = J a x f(x)dx + J bf(x)dx 


OO 00 

= a Jx f(x)dx + b J f(x)dx 

— 00 —00 


car l’intégrale est linéaire 


=a E(X) + b V a, b e R. 

poo /*00 

2) E (a. X + b. Y) = J œ J œ (ax + b)h(x, y)dydx , où h(x, y) est la densité de 
probabilité du couple (X, Y) (voir chapitre 3) 

/•OO /*00 p 00 poo 

= ( ax h(x, y)dy)dx + ( by h(x, y)dx)dy 

J — 00 J — 00 J — 00 J — 00 

00 00 

= a J x f(x)dx + b J y g(y)dy 

— 00 —00 

= a E(X) + b E(Y) V a, b e R. 
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3.4. Moments d’une variable aléatoire 


Définition 2.9 

Soit X une v.a.r sur (Q, A , P), 

1) On appelle moment d’ordre k,ke Z*, le nombre m k défini par : 

m k = E (X k ) 

2) On appelle moment centré d’ordre k, k e Z*, le nombre p k défini par : 
p k =E[X-E(X)] k . 


Exemple 2.9 

Reprenons l’exemple 2.7 


. m k =E(X k ) =... = - 


k + 1 


3(k + l) (k + 1) 


, Vk> 1. 


• p k =E[X-E(X)] k =E[X— | ] k =...= 1 1 


ffx--ï k+1 l 3 

3(k + l) Ll 2 J J 0 


\k+l 


- — - — [(-) k+1 -(--) KTi l 
3 (k + l) LV 2 2 


0 si k est impair. 

1 2 3 


( — ) k+1 si k est pair. 


3 (k + 1) 2 


Remarque 

Le moment centré d’ordre 2 (k = 2) est appelé la variance de X, cette variance 
est notée = V(X) = p 2 = E[X - E(X)] 2 = E(X 2 ) - [E(X)] 2 

X 

a = A /V(X) est appelé l’écart - type de X. 

X 

Théorème 2.10 

Soient X et Y deux variables aléatoires définies sur le même espace 
probabilisé (Q, A , P), alors on a : 

1) VaeR, V (a. X) = a 2 Y (X) 

2) V b e U, V (X + b) = V (X) 

3) Y (X + Y) = Y (X) + Y (Y) +2 E [(X - E(X)) (Y - E(Y))] 


Démonstration 
1) Soit a e [R, alors 

V (a. X) = E[(a X - E(a X))] 2 = E[ a 2 (X - E(X)) 2 ] = a 2 E[ (X - E(X)) 2 ] = a 2 V (X). 
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2) Soit b e IR, alors 

Y (X + b) = E[(X + b) - E(X + b))] 2 = E[(X + b - E(X) - b)] 2 = E[(X - E(X))] 2 = Y 
(X). 

3) V (X + Y) = E [(X + Y) - E(X + Y))] 2 = E [(X - E(X)) + (Y - E(Y))] 2 

= E[(X - E(X)) 2 + E(Y - E(Y)) 2 + 2 E [(X - E(X)(Y - E(Y))] 

= V (X) + V (Y) + 2 E[(X - E(X))(Y - E(Y))]. 
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Chapitre 3 
Lois usuelles 


1. Introduction 

On a un phénomène aléatoire que l’on veut comprendre. Ce phénomène 
aléatoire est à priori complexe et on ne peut calculer directement les probabilités 
de ses événements. 

Ex : comprendre la dépense annuelle des ménages marocains pour les loisirs; par 
exemple, on veut calculer la probabilité qu’ils dépensent 5 000 dh par an. On 
dispose donc d’une population pour laquelle le modèle est destiné, d’un individu 
et d’un caractère étudié (représenté par une variable aléatoire X). 

Que fait-on ? 

1 - Pour avoir une première idée du phénomène représenté par une variable 
aléatoire X, on peut faire plusieurs observations de X. 

Ex : X = dépense annuelle pour les loisirs d’un ménage (variable aléatoire 
attachée à un individu). On demande à un certain nombre de ménages ses 
dépenses annuelles en loisirs. On a donc la valeur de Xi, Xi étant la dépense 
annuelle pour le ménage i. 

Cette suite d’observation débouche sur la définition d’une variable statistique X 
souvent décrite de la manière suivante : 

Valeurs de X fréquences 

X i fi = m /n 

On étudie cette variable statistique à l’aide des techniques des statistiques 
descriptives. 

2 - Il y a quelques lois de probabilité ou lois théoriques qui décrivent assez bien 
un grand nombre de phénomènes aléatoires. On veut représenter le phénomène 
aléatoire par une loi de probabilité théorique. Cette modélisation est évidemment 
plus riche que la représentation par une variable statistique : ici on peut calculer la 
probabilité de tout événement associé au phénomène aléatoire. Dans ce chapitre, 
nous allons fournir un catalogue de lois de probabilité discrètes (description, 
étude) souvent utiles en pratique. 

Le statisticien plus chevronné construira ses propres modèles théoriques. 

3 - Après le choix d’un modèle théorique se pose la question suivante : peut-on 
quantifier l’approximation du phénomène aléatoire par le modèle théorique. 
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2 


Loi de Bernoulli 


Toute épreuve n’ayant que 2 résultats possibles peut-être considérée comme 
une situation d’alternative. 

En d’autres termes, les 2 résultats possibles sont complémentaires l’un de l’autre. 

Il s’agit d’une situation fréquente dans la pratique dès que l’on cherche à mettre 
en 'évidence un caractère particulier au sein d’une population : tout individu de 
cette population peut être décrit selon une alternative : soit il présente ce caractère, 
soit il ne le présente pas. 

Exemple 3.1 : Etude de l’impact d’une campagne publicitaire pour un nouveau 
produit. 

Q1 : Est-ce que l’individu possédait ce produit auparavant ? 

Q2 : L’individu a-t-il été touché par la campagne ? 

Q3 : La campagne a-t-elle induit l’achat ? 

Souvent les résultats possibles sont des objets qualitatifs. Pour les quantifier, il 
faut leur trouver un codage. 

On définit ainsi une v. a . X dite de Bernoulli (savant suisse 1654-1705) par 

[l ( succès ) avec la probabilité p 
1 0 {échec) avec la probabilité 1 - p 


Définition 3.1 

On réalise une expérience aléatoire qui a 2 résultats possibles : le succès avec 
la probabilité, p, et l’Echec avec la probabilité 1 - p. La v.a 

f 1 si succès 

X = 

[0 si échec 


Propriété 

E(X) = p 
V (X) = p (1 - p) 

Remarque : 

La loi Bernoulli est la plus simple des lois de probabilité. 

3 La loi Binomiale 

C’est une succession d’épreuves de Bernoulli ( n ) indépendantes. 

Définition 3.2 

On réalise n fois successivement et d’une manière indépendante une 
expérience aléatoire qui a 2 résultats possibles, succès avec la probabilité p et 
l’échec avec la probabilité q =1 - p. 
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X = nombre de succès obtenus est une v. a. binomiale de paramètres n et p. 

Notation: X ~ B (n, p). 

Remarque : 

On peut également la définir comme une somme de v. a. de Bernoulli. 

A chaque épreuve i, on associe la v. a. de Bernoulli Xi 
X = ZXi. 

Loi de probabilité : X ~ B (n, p) 

X(Q)={0,...,n} 

P(X = k) = C k n p k (\ - p) n ~ k , 8 k = 0, 1, n 

n : nombre d’épreuves, 
k : nombre de succès), 
p : probabilité du succès. 

Propriétés 

E(X) = n p 

V (X) = n p(l - p) = n p q 
Remarque : 

La loi binomiale est une loi tabuler. 

Exemple 3.2 

Une machine à embouteiller peut tomber en panne. La probabilité d’une panne à 
chaque emploi est de 0,01. La machine doit être utilisée 100 fois. 

Soit X= nombre de pannes obtenues après 100 utilisations. 

1) Quelle est la loi de X ? 

Calculer P(X = 0), P(X = 1) et P(X - 4). 

2) On estime le coût d’une réparation à 500 F. Soit la v.a Y représentant la 
dépense pour les réparations après 100 utilisations. 

Exprimer Y en fonction de X et calculer E(Y) V (Y). 

Solution: 

1) X s B (100, 0.01) ; P(X = 0) = C^O-Ol) 0 ^^) 100 = 0, 366 
P(X = 1) =<2,00 (0.0 1) 1 (0.99)" = 100 x 0, 01 x (0.99)" = 0, 377 

P(X = 4) = 1 - (. . ,) = 0, 061 

2) Y = 500X 

E(Y) = 500 E(X) = 500 x 100 x 0, 01 = 500 

V (Y) = 500 2 V (X) = 5 00 2 0, 99 = 247500 
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Exemple 3.3 

Dans une pépinière 95% des scions (jeunes arbres greffés) sont supposés sans 
virus. Par commodité les scions sont rangés par paquets de 2. Un paquet est dit 
sain si les 2 scions le sont. 

1) Quelle est la probabilité d’avoir un paquet sain ? 

2) X = nombre de paquets sains sur un lot de 10. Quelle est la loi de X ? 

3) Un lot de 10 est accepté par l’acheteur si 9 au moins des paquets sont sains. 
Quelle est la probabilité qu’un lot soit accepté ? 

Solution : 

1) p = 0, 95 x 0, 95 = 0, 9025 

2) X s B (10, p) 

3) P(X > 9) = P(X = 9) + P(X = 10) = 0, 7361 

4 Loi de Poisson 

Siméon Denis Poisson (1781-1840) est un probabiliste, mathématicien et 
physicien français à qui l’on doit d’importants développements sur la loi des 
grands nombres, les suites d’épreuves de Bernoulli mais aussi sur les applications 
des probabilités dans le domaine du droit. 

Définition 3.3 

X est une v. a. de Poisson de paramètre X si et seulement si 

A k 

X (Q) = N, et P(X = k) =<?- 1 — , V k e N. 

A\ 


Notation : P (k) 

On est dans la situation où X (Q) est infini dénombrable. On peut maintenant 
poser la loi de Poisson comme modèle d’une épreuve aléatoire : 

Exemple 3.4 

Dans un hôpital parisien, il arrive en moyenne 1,25 personnes à la minute aux 
urgences entre 9 h et 12 h. 

X : nombre de personnes observées à la minute à l’entrée de ce service. 

On admet X s P (7.) avec X = 1 , 25 
Déterminer les probabilités suivantes 

a) En lmn il arrive 2 personnes b) 4 personnes au plus c) 3 personnes au moins. 

a) P(X = 2) = 0, 2238 

b) P(X = 4) = 0, 9909 

c) P(X = 3) = 1 - P(X < 2) 

= 1 -0, 8685 
= 0, 1315. 

4. Loi de Laplace - Gauss ou loi normale 

Lorsqu’une grandeur subit l’influence d’un grand nombre de facteurs de 
variation, et que ceux-ci sont très petits et indépendants les uns des autres. On 
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peut démontrer que les valeurs de cette grandeur se distribuent suivant une loi de 
Laplace - Gauss. Cette propriété confère à cette loi, appelée plus simplement ‘Toi 
normale 

Considérons par exemple une variété commercialement pure de blé cultivé sur 
un grand nombre de petites parcelles (disons 500) toutes égales. Toutes ces 
parcelles sont réparties sur un champ aussi homogène que possible. A la récolte, 
on constate que le poids de grain par parcelle varie de façon assez importante. 
C’est que de nombreux facteurs de variation sont venus exercer leur influence sur 
le rendement. Et aussi entre les grains de variété pure, il existe des légères 
différences. Il y a aussi la fertilité des parcelles qui n’est pas uniforme. On 
pourrait prendre aussi en compte l’action des pluies, de la température qui n’a pas 
été identique en tous les points des champs. Les mauvaises herbes se sont 
développées de façons irrégulières de que l’action des insectes et parasites, etc. 
Dû à toutes ces irrégularités, les rendements parcellaires présentent une certaine 
dispersion, et Ton constate que ceux-ci se distribuent suivant une loi voisine d’une 
loi normale. 


La loi normale occupe une place de choix parmi les différentes lois de 
probabilité. 


Définition 3.4 

Une variable aléatoire X admet une distribution normale, de paramètres 
m e U et a > 0, si la densité de probabilité est 


f(x) 



1 

2cT 


(x-m) 2 


, Vxe.R 


Notation X ~ N (m, a ) 


Propriétés 


a) E(X) = m et V(X) = a 2 

b) La loi normale, notée N (p, a ), est symétrique par rapport à la droite 
d'abscisse m. 
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Exemples 3.5 


0.5 
0.4 
0.3 

Ü ; 2 
0.1 

O 

-A -3 -2 -1 D 1 2 3 4 

Figure de la normale N (m, 1) pour les valeurs de m = -2 ; 0 et 2 

1.4 
1,2 

1 

a. 6 

D,3 

3.4 
0,2 

0 

-3-210123 

Figure de la normale N (0, a ) pour les valeurs de a = 0.3 ; 1 et 2 

Remarque 

Il est souvent plus aisé de se ramener à une normale centrée réduite N (0,1) 
appelée variable aléatoire centré réduite (m = 0 et a = 1), pour cela il suffit de 
poser 



£, = (E (£,) = 0 et V (£,) = 1) => la densité de probabilité de ç, est 

<7 

1 2 

1 X 

g (x) = -, — e ^ VxeR. 
y/2n 
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Figure de la normale centrée réduite N (0, 1) 


V x > 0 (-x) = 1 - F, (x) 
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Chapitre 4 


VARIABLES ALEATOIRES 
BIDIMENSIONNELLES 
ET LOIS DE PROBABILITE 


1. VARIABLES ALEATOIRES BIDIMENSIONNELLES 


En pratique, on est souvent amené à étudier simultanément, pour n 
individus, les observations relatives à deux variables ou caractères. Par 
exemple : pour un gaz, la pression et le volume, à température constante; 
la taille et le poids des individus; les ventes et les prévisions de vente d'un 
bien en différents lieux; les ventes d'une entreprise en fonction du temps; 
les prix et les quantités demandées pour un bien économique. 

Définition 3.1 

Soit (Q, A, P) un espace probabilisé, le couple (X, Y) est appelé une 

variable aléatoire bidimensionnelle réelle, si X et Y sont à valeurs dans IR 
et si chaque élément du couple est une variable aléatoire. 


Exemple 4.1 

On jette simultanément un dé blanc et un dé noir. 

X : désigne le nombre sur la face supérieure du dé blanc 
Y : désigne le nombre sur la face supérieure du dé noir. 

(X, Y)(Q) = V ((X, Y)) = {(i,j) ; i = 1, 2, 3, 4, 5, 6 et j = 1, 2, 3, 4, 5, 6 } est 
l’ensemble des valeurs prises par le couple (X, Y). 

2. LOIS DE PROBABILITE BIDIMENSIONNELLES 

2.1. Lois de probabilité bidimensionnelles discrètes 

Définition 4.2 
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Soit (Q, A, P) un espace probabilisé, le couple (X, Y) est une variable 

aléatoire bidimensionnelle discrète, si X et Y sont des variables aléatoires 
discrètes. La loi de probabilité de (X, Y) est donnée par p(x, y) = P(X = x, 
Y = y)VxelRVye[R, avec 

p(x, y) = > 0, V x e IR, V y e IR, 

Z Z X y p(x, y) = 1 

x y 


Remarque 

Si X prend les valeurs x-i, x 2 x k Y prend les valeurs y-i, y 2 , ..., yi 

Alors (X, Y) prend les valeurs (Xi, yj) pour i = 1 , 2, . . . , k et j = 1 , 2, . . . , I. 

La loi de probabilité est souvent présentée sous la forme d’un tableau à 
double entrée. 

Exemple 4.2 

Un sac contient 4 boules numérotées de 1 à 4. On tire deux boules avec 
remise, et on note X et Y les numéros obtenus. 

Soient X et Z = Sup(X, Y). 

Q = {I, 2, 3, 4} 2 et P est la probabilité uniforme. 

Les lois de (X, Y) et de (X, Z) sont données par les tableaux suivants : 


Y 

X 

1 

2 

3 

4 

1 

1 

1 

1 

1 


16 

16 

16 

16 

2 

1 

1 

1 

1 


16 

16 

16 

16 

3 

1 

1 

1 

1 


16 

16 

16 

16 

4 

1 

1 

1 

1 


16 

16 

16 

16 
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Définition 4.3 

Soit (Q, A, P) un espace probabilisé, le couple (X, Y) est une variable 

aléatoire bidimensionnelle continue, si X et Y sont des variables aléatoires 
continues. La fonction de densité de probabilité f(x, y) est telle que : 

1 ) f(x, y) > 0, V x g IR, V y g IR, 

2) J J f(x, y)dx dy = 1 . 

00 00 


Exemple 4.3 

On considère un couple (X, Y) de variable aléatoire, de densité de 
probabilité 


f(x,y) = 



si 0<x<1et0<y<1 


ailleurs 
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_3.164 



f 


r 





1 

2W5V2 e 

0 


(x 2) 2 x e y 

ailleurs 


si 0 < x < 1 et 0 < y < 1 



f 


On a : 


1 ) f(x, y) > 0, V x e IR, V y e IR, 

+00+00 +co +t» ^ r \ +°$®+°$® 

2) JJ f(x, y)dxdy = || — -xe y dxdy = — - ||xe y dxdy 


+00 +00 
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2 

e 1 


i<-D = i- 


Remarque dans le cas continu P(X = x, Y =y ) = 0, V x e IR, V y e M. 


3. FONCTION DE REPARTITION D’UN COUPLE DE VARIABLE 
ALEATOIRE 

Définition 4.4 

La fonction de réparation de (X, Y) est définie par 

F(x, y) = P(X < x, Y< y) , V(x,y)eR 2 


Propriétés 

La densité de probabilité est f(x, y), chaque fois que les dérivées 
partielles existent. 

• lim F(x, y) = lim F(x, y) = lim F(x,y) = 0 

x ^_oo y^_°° y^_°° 

X— * _oo 

• lim F(x, y) = 1 

y-* +oo 
X-* +oo 

• si a < b et c < d, alors 

P(a < X < b , c < Y < d) = F(b ,d) - F(b, c) - F(a, d) + F(a, c) > 0. 

4. LOIS MARGINALES 

De la fonction de probabilité du couple (X, Y), on déduit aisément la 
fonction de probabilité unidimensionnelle de X et de Y appelée : loi 
marginale de X et loi marginale de Y. 

4.1. Cas discret 


Si V(X) = { xi,x 2 x k } et si V(Y) = { yi, y* .... yi}, alors : 


la loi marginale de X est donnée par pj .= P(X = Xi )= X P - V i = 1 k 

j=i y 
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k 

et la loi marginale de Y est donnée par p # . = P(X = yj) = X P - V j = 1 , 

* j i=i y 


...,i. 


Reprenons l’exemple 4. 2 


X 

1 

2 

3 

4 


Z 





Pi. 

1 

1 

1 

1 

1 



16 

16 

16 

16 

4 

2 

0 

2 

1 

1 

16 



16 

16 

16 

4 


0 

0 

3 

1 

16 

3 

0 

0 

16 

16 

4 




0 

4 

16 





— 

4 

4 




16 







16 

p -j 

1 

3 

5 

7 

i 

16 

16 

16 

16 


La loi marginale de X est donc 


Xi 

1 

2 

3 

4 

Pi. 

1 

1 

1 

1 

4 

4 

4 

4 


La loi marginale de Y est donc 


yj 

i 

2 

3 

4 

p -j 

i 

3 

5 

7 

16 

16 

16 

16 


4.2. Cas continu 


Si le couple (X, Y) admet une densité de probabilité f(x, y), alors : 
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La loi marginale de X possède comme densité la fonction f(x) = I f(x, 
y)dy 

La loi marginale de Y possède comme densité la fonction g(y) = I f(x, 
y)dx 

Reprenons l’exemple 4.3 

+ r + > 2 

• f(x) = 1 f(x, y)dy = I x e y dy = 2x pour x e[ 0 , 1 ] 

oo oo 6 

C’est - à dire f(x) -j 2x si 0 < x < 1 

0 ailleurs 

+°° 2 

• g(y)= f(x,y)dx= — -xe y dx= — - pour y e[ 0 , 1 ] 

J Jet e 1 


C’est - à dire g(x) = 


si 0 < y < 1 


e 1 

0 ailleurs 


5. VARIABLES ALEATOIRES INDEPENDANTES 


Deux variables aléatoires X et Y sont dits indépendantes, au sens des 
probabilités, si V a, b, c, d e U, les événements ( a < X < b) et ( c < Y < d) 
sont indépendants, c’est - à - dire 
P(a<X<b)n(c<Y<d)) = P(a<X<b)P(c<Y<d). 

a) cas discret 

X et Y sont indépendantes Pÿ = Pi* P. j > v ■ = ^ ■ ,k et V j = 1 1. 

Exemple 4. 4 
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L’expérience consiste à lancer un dé parfait et une pièce de monnaie 

3 

non équilibrée de telle sorte que P (pile) = — . 

Considérons les variables aléatoires X et Y, telle que (X = 0) = (avoir 
pile), (X = 1) = (avoir face) et Y est le nombre obtenu par la face 
supérieure du dé. 

Donc la loi de probabilité du couple est donnée par le tableau suivant 


Y 

X 

1 

2 

3 

4 

5 

6 

Pi. 

0 

1 

1 

1 

1 

1 

1 

3 


8 

8 

8 

8 

8 

8 

4 

1 

1 

1 

1 

1 

1 

1 

1 


24 

24 

24 

24 

24 

24 

4 

p -j 

1 

1 

1 

1 

1 

1 

1 

6 

6 

6 

6 

6 

6 



On peut facilement vérifier que p.^ = Pj . p. j ; V i = 1 , 2 et V j = 1, 6, 

donc les 2 v. a sont indépendantes, 
b) cas continu 

X et Y sont indépendantes <=> f(x, y) = f(x) g(y) ; V x , y e IR, c’est - à - 
dire la densité du couple est égale au produit des densités marginales. 

Exemple 4.5 

Reprenons l’exemple 3.3 pour lequel nous avons 

2 

f(x,y) = x e y si 0<x<1et0<y<1 

e 1 

0 ailleurs 

Cette fonction f(x, y) on peut l’écrire de la façon suivante 
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2 e y 

f ( x > y) = TX e y 1 [o>l] (x) 1 [0>l] (y) = — -1 [ 0>l] (y) 2x 1 [o>l] (x) = f(x) 

Cl Cl 

g(y). V x , y e U, donc les deux variables X et Y sont indépendantes. 

6. ESPERANCE MATHEMATIQUE ET MOMENTS 
Définition 4.5 

Soit (X, Y) une variable aléatoire bidimensionnelle, on appelle 
espérance mathématique de (X, Y), le vecteur E ((X, Y)) = (EX, EY) 

Définition 4.6 

On appelle moment centré d’ordre r+s, pour la variable aléatoire (X, Y), 
l’expression p rs = E [(X - EX) r (Y - EY) 8 ], r , s e N. 

Cas particuliers 

Si r = 2 et s = 0, alors p 2 o = E [(X - EX) 2 ] = g x 2 = variance marginale de X 

Si r = 0 et s = 2, alors p 0 2 = E [(Y - EY) 2 ] = g y 2 = variance marginale de Y 

Si r = 1 et s = 1 , alors pu = E [(X - EX) (Y - EY)] = E (XY) - E(X) E(Y) = g xy 

= covariance de X et Y, notée cov(X, Y). 

On appelle la matrice de variance - covariance de (X, Y), la matrice 



Remarque 

* Si les variables aléatoires X et Y sont indépendantes, alors cov(X, Y) =0. 

* Si les variables aléatoires X et Y sont indépendantes, alors 
E (XY) = E(X) E(Y). 

* Si les variables aléatoires X et Y sont indépendantes, alors 
V(X+Y) = V(X) + Var(Y). 

Définition 4.7 
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Le coefficient de corrélation entre X et Y est défini par 

Cov(X, Y) a XY A 

Pxy = = , on suppose o x * 0 et a Y * 0. 

G X a Y G X G Y 

Le modèle statistique le plus simple à utiliser et à comprendre est le 
modèle de régression linéaire simple. C'est le modèle qui permet de 
mesurer l'influence d'une variable quantitative sur une autre variable 
quantitative. 

On peut s'intéresser par exemple à l'influence de la température sur la 
longueur d'une tige en métal, tel qu'un rail de chemin de fer. Tout le 
monde sait que les rails de chemins de fer ne sont pas placés avec une 
jointure parfaite en raison de l'élongation due à la chaleur. 

On peut s'intéresser à l'influence de la taille sur le poids, pour des 
animaux ou des êtres humains, ou de l'ancienneté sur le salaire. Attention 
dans les trois exemples que j'ai pris, j'ai pris soin de donner que des 
variables continues, ou pour lesquelles la continuité est acceptable. J'ai 
aussi pris soin de prendre trois exemples dans lesquels il n'y a pas 
vraiment d'ambiguïté sur le sens de la liaison entre les variables, personne 
ne penserait à dire que c'est la hauteur du mercure dans un tube qui 
influence la température ou qu'une augmentation de salaire fait augmenter 
l'ancienneté. 

La plupart du temps, les utilisateurs pensent que pour mesurer une 
liaison entre deux variables quantitatives il faut calculer un coefficient de 
corrélation linéaire. Il est sur que la régression linéaire simple et le calcul 
du coefficient de corrélation linéaire ont un lien très fort entre eux, mais 
ont certaines différences qu'il s'agit de comprendre. Tout d'abord il faut 
noter que pour les variables quantitatives qui ne sont pas continues, on 
utilise très souvent les coefficients de corrélation et la régression linéaire 
et qu'il s'agit dans les deux cas d'une approximation. La continuité parfaite 
des variables n'existe pas très souvent dans la réalité. 

Une fois cela noté, la différence essentielle, réside dans le fait que 
dans la corrélation le rôle des deux variables est parfaitement 
interchangeable, dans la régression linéaire il ne l'est pas. Ce ne sont pas 
les statistiques qui peuvent dire si une variable est explicative ou à 
expliquer. Les avantages de la régression linéaire simple par rapport à la 
corrélation linéaire sont nombreux. 
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Les principes de la régression linéaire simple se généralisent à la 
régression non linéaire, quadratique ou logarithmique par exemple, mais 
surtout à la régression multiple, puis à la régression sur variables 
qualitatives que l'on appelle analyse de variance, et à toutes les variantes 
de ce que l'on appelle les modèles linéaires, analyses de covariances et 
autres. 

Théorème 4.8 

Quelque soit les variables aléatoires X et Y, nous avons 

-1 < pxy < 1 


Démonstration 

Ipxy | = — | E [(X - EX) (Y - EY)] | < — E|(X - EX) ||(Y - EY)| 

a x a Y a x a Y 

< — — (e(X EX) 2 )2 (e(Y EY) 2 )2 , d’après l’inégalité de Schwartz 
ct x ct y 


a x a Y 




Exemple 4.6 


Soit (X, Y) un couple de v.a. dont la loi de probabilité est 


Y 

X 

1 

2 

Pi. 

0 

1 

1 

3 


— 

— 

— 


2 

4 

4 

1 

1 

4 

0 

1 

4 

p -j 

3 

4 

1 

4 

1 


La loi marginale de X 


X 


0 


1 
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9 9 3 9 1 

E(X 1 2 ) = 0 2 . - + I 2 . 

4 4 

1 

4 


E(X) = 0. |+1. - = - 

4 4 4 


V(X) = 




3 1 5 

E(Y) = 1 . - +2. - = - 

4 4 4 


O O 3 O 1 

E (Y 2 ) = I 2 . - + 2 2 . - 
4 4 


7 

4 


V(Y) = 




cov(X,Y) = E(XY) - E(X)E(Y) 

E(XY) = Zj Zi Xi yj p.. =0.1. — + 0.2. -+1.1. -+1.2.0= - 
J J ij 2 4 4 4 


» Cov(X, Y) = i - 


1 5 

4 ' 4 


1 

— et pxY = 


Cov(X,Y) 

a X G Y 



1 

3 ' 

Théorème 4.9 

Si |pxy| = 1, alors il existe une relation fonctionnelle linéaire entre X et 
Y 
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Démonstration 
Supposons que pxy = 1 

_ „ _ Cov(X,Y) _ 1 

PXY - 1 “ - 

a x a Y g x g y 


E [(X - EX) (Y - EY)] = E [(—=—)(—=—)] 

°X a Y 


Posons £, - 


X EX Y EY 

et ri = 

o x o Y 


, on peut remarquer que les v. a. £, et r\ 


sont centrées réduites. 

=> 1 = Efé Tl), calculons Vft - T, ) = E«£, - r, ) 2 ) = Efë 2 ) + E( n 2 ) - 2 E(5 r,) 

= 1 + 1 -2 = 0 


£, = q presque sûrement 




X_EX 


Y = — X + (E(Y) - — E(X)) = a X + b 

Gy G x G x 


avec a = — et b = (E(Y) - — E(X)). 

°x CT X 

Le même raisonnement se fait pour p X Y = -1 ■ 

♦ 

Théorème 4.10 

a) Si X et Y sont deux variables aléatoires indépendantes => p X Y = 0 

b) La réciproque n’est pas vraie, sauf si X et Y sont normales. 


Démonstration 

a) X et Y sont indépendantes => 

cov(X,Y) = E[(X - EX)(Y - EY)] = E[(X - EX)] E[(Y - EY)] = 0 

=> pXY = 0. 

b) contre exemple 

Soient X et Y 2 v.a. dont la loi jointe est donnée dans le tableau suivant 


Y 

X 

0 

1 

4 

Pi. 

-2 

0 

0 

1 

4 

1 

4 
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-1 

0 

1 

0 

1 



8 


8 

0 

1 

0 

0 

1 


4 



4 

1 

0 

1 

0 

1 



8 


8 

2 

0 

0 

1 

1 




4 

4 

p -j 

1 

1 

1 

1 

4 

4 

2 



La loi marginale de X 


X 

-2 

-1 

0 

1 

2 

Pi. 

1 

1 

1 

1 

1 

4 

8 

4 

8 

4 


E(X) = -2. - + -1. -+0. -+1. - + 2. - = 0 

v ' 4 8 4 8 4 


La loi marginale de Y 


Y 

0 

1 

4 

p -j 

1 

1 

1 




4 

4 

2 


cov(X,Y) = E(XY) - E(X)E(Y) = E(XY) = Zi Zj Xi y, p = 0 
=> pxy = 0, mais 

P(X = 0 et Y = 0) = - et P(X=0) P(Y = 0) = - . - = — 

4 4 4 16 

=> P(X = 0 et Y = 0) * P(X = 0) P(Y = 0) => X et Y ne sont pas 
indépendantes. 

7. LOIS CONDITIONNELLES 
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Définition 4.11 

Soit (X, Y) une variable aléatoire bidimensionnelle 
1) discrète, la fonction de probabilité conditionnelle de Y étant donnée 
X = x est définie par : 


p(y I x) = 


p(x,y) 

1 P(x) 


0 


si p(x) > 0 
sinon 


Même chose pour p(x | y). 


2) continue, la fonction de densité conditionnelle de Y étant donnée 
X=x est définie par 


f(y|x) = 


-< 


f(x,y) 

f(x) 

0 


Même chose pourf(x | y). 


si f(x) >0 
sinon 


Remarque 

Si X et Y sont indépendantes, alors 
f(y | x) = g(y) (= la densité marginale de Y) 
et 

f(x | y) = f(x) (= la densité marginale de X). 


Exemple 4. 7 

On considère le couple (X, Y), où X est revenu annuel du mari et Y est 
le revenu annuel de la femme en milliers de dirhams. 


Y 

X 

5 

10 

15 

Pi. 

10 

1 

IÔ 

2 

ÏÔ 

0 

3 

IÔ 
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15 

1 

Tô 

o 1 ^ 

1 

Tô 

4 

Tô 

20 

0 

O 1 ^ 

1 

Tô 

O 1 w 

P. ; 

2 

6 

2 

1 

•J 

Tô 

TÔ 

Tô 



Loi de (Y|X= 10) 


Y|X= 10 

5 

10 

15 

P(Y|X=10) 

1 

3 

2 

3 

0 


En effet, 


1 


P ( Y = 5|X=10) = P<Y = 5X = 10) = f = I 
v 1 ’ P(X = 10) 3 


P(Y = 10 | X = 10) = 


10 


P (Y = 10X = 10) 2 


P(X = 10) 


Exemple 4.8 

Soit (X, Y) un couple de v.a. dont la densité de probabilité est 


f(x,y) = J 8xy si 0< x <1 et 0 < y < x 
0 ailleurs 


la densité marginale de X 
f(x) = 1 f(x,y)dy = j 8xydy pour 0< x <1 
= 4 x 3 pour 0< x <1 


f(x) = 


4 x 3 
0 


pour 0< x <1 
ailleurs 
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la densité marginale de Y 


g(y) = I f(x,y)dx = \ 8xy 1 {o%sa} (x) dx pour 0 < y <1 

= 1 8xy 1 {0;%s3} (x) dx pour 0 < y <1 


g(y) = 




4y(1 -y 2 ) si 0 < y <1 
0 ailleurs 


ïïïJxi 


r 


f(y I x) =J 




f(x,y) 

f(x) 

0 


f(x I y) 


x 2 

0 


si f(x) >0 
sinon 

si 0<x<1et0<y<x 
sinon 


f(x I y) = 


f(x,y) 

g(y) 

o 


si g(y) >0 
sinon 


2x 


si 0<x<1et0<y<xety^1 


< a y 2 ) 

0 sinon 

On peut déduire aisément que les v. a. X et Y ne sont pas indépendantes 
car f(x, y) * f(x) g(y). 
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